Hướng dẫn lập trình CUDA: Các mô hình kiến trúc: von Neumann so với Harvard

Thiết kế cơ bản của một hệ thống tính toán được xác định bởi mối quan hệ giữa Bộ xử lý và Bộ nhớ. Sự khác biệt chính nằm ở việc các lệnh và dữ liệu có chia sẻ một đường truyền duy nhất hay sử dụng các kênh riêng biệt.

1. Kiến trúc von Neumann

Được sử dụng trong các hệ thống phổ thông như x86-64, mô hình này có không gian bộ nhớ thống nhất. Bộ xử lý truy cập cả mã lệnh và dữ liệu qua một bus duy nhất, dẫn đến hiện tượng bẫy von Neumann: độ trễ xảy ra khi bộ xử lý phải chuyển đổi giữa việc lấy lệnh và truy cập các toán hạng.

2. Kiến trúc Harvard

Thường gặp trong các bộ xử lý chuyên dụng và ARMv8-A các triển khai bộ nhớ đệm L1, thiết kế này sử dụng bộ nhớ và đường truyền tín hiệu vật lý riêng biệt. Điều này cho phép lấy đồng thời một mã lệnh và một toán hạng dữ liệu, làm tăng đáng kể băng thông.

Sơ đồ luồng: Chu kỳ truy xuất bộ nhớ trong kiến trúc von Neumann cho thấy việc sử dụng bus tuần tự.

3. Sự hội tụ cấu trúc

Các hệ thống HPC hiện đại thường sử dụng kiến trúc Harvard đã sửa đổi. Chúng hoạt động giống như máy Harvard ở cấp độ bộ nhớ đệm L1 (tách biệt bộ nhớ đệm lệnh I-cache và bộ nhớ đệm dữ liệu D-cache) để tối đa hóa tốc độ, đồng thời duy trì mô hình von Neumann tại bộ nhớ chính RAM để linh hoạt trong lập trình.

TERMINALbash — 80x24

> Ready. Click "Run" to execute.

QUESTION 1

What is the defining characteristic of the von Neumann Bottleneck?

The CPU speed is slower than the bus speed.

A single bus must alternate between fetching code and accessing data.

The memory capacity is too small for modern code.

The L1 cache and L2 cache use different voltages.

QUESTION 2

Which architecture is typically used for L1 cache implementations in ARMv8-A?

Pure von Neumann

Harvard Architecture

Stack-based Architecture

Single-Bus CISC

QUESTION 3

In a Modified Harvard Architecture, where does the 'von Neumann' aspect usually reside?

At the L1 Cache level

At the Main RAM/Global Memory level

Inside the Arithmetic Logic Unit

In the register file

QUESTION 4

What advantage does a von Neumann architecture provide to Just-In-Time (JIT) compilers?

It prevents memory fragmentation.

It treats written instructions exactly like data variables.

It allows for higher clock frequencies.

It automatically encrypts memory.

QUESTION 5

How many clock cycles are minimally required to fetch one instruction and one data operand in a pure Harvard architecture?

One cycle (Simultaneous fetch)

Two cycles (Sequential fetch)

Four cycles (Multiplexed fetch)

Zero cycles (Pre-cached)